افزایش کیفیت و بهبود عملکرد سیستم های تبدیل گفتار فارسی

پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی برق
نویسنده مهدی اسلامی
استاد راهنما ابوالقاسم صیادیان حمید شیخ زاده
تعداد صفحات: ۱۵ صفحه ی اول
سال انتشار 1385

چکیده

در این رساله به مطالعه و پیاده سازی سیستم تبدیل گفتار با کیفیت بالا پرداخته شده و روش های افزایش کیفیت و بهبود عملکرد آنها در زبان فارسی مورد بررسی قرار گرفته است. در سیستم های تبدیل گفتار، گوینده a (مبدا) عباراتی را بیان می کند و هدف از آن عبارت است از تغییر متکلم جملات بیان شده از گوینده aبه گوینده b(مقصد). کاربرد سیستم های تبدیل گفتار در ساخت پایگاه دادگان گفتاری جهت کاربرد در سیستم های تبدیل متن به گفتار و بازشناسی گفتار است. همچنین این سیستم قابل استفاده در صداگذاری فیلم ها و ... می باشد. در این قبیل کاربردها، صدای هر گوینده در محیط استودیو ضبط شده است و نیازی به پردازش بلادرنگ ندارد. روش آماری مبتنی بر gmm بهترین کارایی را در مقایسه با روش های دیگر دارد. این روش بعلت دخالت دادن تمامی خوشه ها در تولید یک بردار برای گوینده جدید، دارای حالت بلـورشدگی(کاهـش وضوح) در صدای بازسازی شده می باشد به گونه ای که بازسازی صدا (با تغییر گوینده) توسط روشهای مذکور نسبت به حالت کاملاً طبیعی، فاصله زیادی دارد. در روش gmm(2) از مدل های متعدد gmm برای مدلسازی هر واج استفاده نموده ایم. همچنین در مرحله متناظرکردن خوشه های هر حالت، قبل از اعمال الگوریتم dtw از یک تبدیل lmr برای انطباق بیشتر پارامترهای دو حالت متناظر از دو گوینده استفاده می شود. در روش gmm(3) به منظور ارایه تخمـین دقیـق تر سیگـنال گفـتاری و کیفـیت بالاتـر سیگنال تـبدیل شده، از مـدل ghm استفـاده می شودکه از کارکردی بهتر نسبت به روش قبل برخوردار است. در الگوریتمgmm(4) ویژگی های گفتار بطـور پیوسته با استفاده از همبستـگی میان ویژگی های گفتـار گوینده مبدا و مقصد، تغییر می نمایند. به منظور غلبه بر هموار شدگی طیفی ناشی از متوسط گیری آماری، از واحدهای آوایی نیمه هجا، به عنوان کوچکترین واحدهای آوایی شامل اطلاعات عروضی گفتار استفاده می شود. همچنین با توجه به مزایای ghm، از آن به عنوان آنالیز و سنتز کننده استفاده می شود. در این رساله به ارایه روشی می پردازیم که علاوه بر ویژگی های درون قابی، از ویژگی های برون قابی (دینامیکی) برای یافتن بردار تبدیل یافته از گفتار گوینده a به گفتار گوینده b استفاده می کند. این روش مبتنی بر vq بوده و در آن از یک ساختار شبکه برای یافتن یکی از بهترین مسیرها جهت نگاشت دنباله ای از قاب های گفتاری مربوط به کتاب کد گوینده a به کتاب کد گوینده b استفاده می شود. معیار بهینگی در یافتن مسیر عبارت است از: حفظ ویژگی های دینامیکی گفتار گوینده بعلاوه پیوستگی طیفی در گفتار تبدیل یافته.نوآوری دیگر ارایه شده، استفاده از نیمه هجا به عنوان کوچکترین واحد گفتاری در برگیرنده اطلاعات عروضی از گفتار گوینده است که متناسب با ساختار زبان فارسی می باشد. در نهایت به کمک اصلاحات مناسب دیگری که در روش یادگیری و طراحی تبدیلهای خطی مورد نیاز انجام شده است، به عملکرد بسیار مناسبی در تبدیل گفتار در مقایسه با روشهای رایج نایل شده ایم.

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

کاربرد ریزمغذی‌ها در افزایش عملکرد و بهبود کیفیت انگور

کودهای شیمیایی از جمله ابزارهای لازم برای نیل به عملکردهای بالا برای محصولات کشاورزی هستند. اما کاربرد این مواد مستلزم افزایش و یا بهبود کیفیت محصول نیز می‌باشد. مدیریت مصرف کود در کشور نشان می‌دهد که علی رغم مصرف نسبتاً بالای کودهای شیمیایی، افزایش عملکرد چندان محسوس نبوده و نیز بهبود کیفیتی در تولیدات غذایی مشاهده نشده است. استفاده از کودهای ریزمغذی و پتاسیم یکی از موارد مورد نیاز برای افزایش ...

متن کامل

بهبود کیفیت گفتار مبتنی بر بهینه‌سازی ازدحام ذرات با استفاده از ویژگی های ماسک گذاری سیستم شنوائی انسان

چکیده: در این مقاله، روش‌های دوکاناله جدید زیرفضایی سیگنال با استفاده از تکنیک‌های حذف نویز ادراکی برای بهبود کیفیت سیگنال گفتار پیشنهاد شده‌اند. روش‌های پیشنهادی از مشخصات ماسک‌گذاری سیستم شنوایی انسان برای کاهش نویز باقیمانده قابلشنیدن بهره می‌گیرند. روش تجزیه به مقادیر منفرد کسری ادراکی، تکنیک بهینه‌سازی ذرات را برای تخمین نویز جمعی استفاده می‌کند. نتایج شبیه‌سازی دقیقی که توسط دو معیار مخ...

متن کامل

کاربرد ریزمغذی ها در افزایش عملکرد و بهبود کیفیت انگور

کودهای شیمیایی از جمله ابزارهای لازم برای نیل به عملکردهای بالا برای محصولات کشاورزی هستند. اما کاربرد این مواد مستلزم افزایش و یا بهبود کیفیت محصول نیز می باشد. مدیریت مصرف کود در کشور نشان می دهد که علی رغم مصرف نسبتاً بالای کودهای شیمیایی، افزایش عملکرد چندان محسوس نبوده و نیز بهبود کیفیتی در تولیدات غذایی مشاهده نشده است. استفاده از کودهای ریزمغذی و پتاسیم یکی از موارد مورد نیاز برای افزایش ...

متن کامل

مراحل و نحوه ی تهیه ی دادگان های صوتی هجایی و دایفونی برای سامانه ی تبدیل متن به گفتار فارسی

Abstract Speech databases are part of the concatenative text to speech synthesis systems. Phonetic quality of the databases plays a significant role in the naturalness of the synthesized speech. This paper introduces two syllable and diphone speech databases for Persian and investigates the way of their development and their specifications and their advantages to each other. ...

متن کامل

بهبود عملکرد روش hmm در دیکدر atp گفتار پیوسته فارسی

تغییرات مشخصه آکوستیکی واج ها تحت متن های مختلف موجب شده است که در پیاده سازی سیستم-های بازشناسی گفتار، از واحد های گفتاری وابسته به متن مانند هجا و نیم هجا که اثرات آواهای مجاور را نیز در نظر می گیرند، استفاده شود. با توجه به اینکه زبان فارسی از دسته زبانهایی می باشد که دارای ساختار هجایی ساده ای است، در این تحقیق واحد گفتاری نیم هجا برای مدلسازی طیفی مورد توجه قرار گرفته است و آزمون های متعدد...

15 صفحه اول

شناسایی کسره اضافه در متون فارسی برای استفاده در سیستم های تبدیل متن به گفتار

این تحقیق به شناسایی کسره اضافه در متون فارسی اختصاص دارد. روشهای مورد استفاده برای شناسایی کسره اضافه باید به گونه ای باشند که بتوانند بدون محدودیت در کلیه متون مورد استفاده قرار گیرند. همچنین در هنگام تشخیص دارای سرعت مناسبی نیز باشد. برای آموزش و تست روشهای ارایه شده در این تحقیق از پیکره زبان فارسی تهیه شده توسط پژوهشگاه هوشمند علایم استفاده گردیده استکه برای بخش تست آن از 1000 متن این پیکر...

15 صفحه اول

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}

نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی برق

کلمات کلیدی

تبدل گفتار با کیفیت بالا مدل سازی گوسی ترکیبی مدل تعمیم یافته سلسله مراتبی زبان فارسی تبدیل طیفی بازشناسی گفتار speech recognition آشکارسازی سیگنال صوتی acoustic signal detection سنتز گفتار speech synthesis تبدیل conversion روش آماری statistical method عملکرد performance بهینه سازی

میزبانی شده توسط پلتفرم ابری doprax.com